#import "@preview/touying:0.6.1": *
#import themes.aqua: *
#import "@preview/pinit:0.2.2": *

#show: aqua-theme.with(
  aspect-ratio: "16-9",
  config-info(
    title: [概率论],
    subtitle: [Subtitle],
    author: [数学主义],
    date: datetime.today(),
    institution: [Institution],
  ),
)
#set text(font: ("Calibri", "Microsoft YaHei"), weight: "regular", size: 25pt)

#title-slide()

#outline-slide()

= 回顾
== 多维随机变量
<多维随机变量>
如果 $X_1 \( omega \) \, X_2 \( omega \) \, dots.h \, X_n \( omega \)$
是定义在同一样本空间 $Omega$ 上的 $n$ 个随机变量，则称
$ upright(bold(X)) \( omega \) = \( X_1 \( omega \) \, X_2 \( omega \) \, dots.h \, X_n \( omega \) \) $
为 #strong[$n$ 维随机变量] 或 #strong[随机向量]。

== 联合分布函数
<联合分布函数>
设 $\( X \, Y \)$ 是二维随机变量。对任意实数 $x \, y$，称
$ F \( x \, y \) = P \( X lt.eq x \, Y lt.eq y \) $ 为 $\( X \, Y \)$ 的
#strong[联合分布函数]。

- 这是事件 ${ X lt.eq x }$ 与 ${ Y lt.eq y }$ 同时发生的概率；

- 可以类比"地图上某区域的人口占比"、"铁板上某区域的重量占比"、"左下低、右上高的地形图"。

== 边际分布函数
<边际分布函数>
我们定义$X$ 的#strong[边际分布函数]为：
$ F_X \( x \) := lim_(y arrow.r + oo) F \( x \, y \) = F \( x \, + oo \) . $

同理，
$ F_Y \( y \) := lim_(x arrow.r + oo) F \( x \, y \) = F \( + oo \, y \) . $

#strong[注]：这里的 $F \( x \, + oo \)$ 是一种简写，严格来说应理解为极限
$lim_(y arrow.r + oo) F \( x \, y \)$。

== 联合密度函数
<联合密度函数>
如果存在二元非负函数 $p \( x \, y \)$，使得
$ F \( x \, y \) = integral_(- oo)^x integral_(- oo)^y p \( u \, v \) thin d v thin d u \, $
则称 $\( X \, Y \)$ 为 #strong[二维连续随机变量]，称 $p \( x \, y \)$
为它的 #strong[联合概率密度函数]。

- 类比一维：$F \( x \) = integral_(- oo)^x f \( t \) thin d t$；
- 可以想象为"热力图"：越亮的地方，$\( X \, Y \)$ 越可能出现在那里。
- 可以类比"地图上的人口密度"、"不均匀铁板的密度分布"。

---

若 $G$ 是平面上的区域，则
$ P \( \( X \, Y \) in G \) = integral.double_G p \( x \, y \) thin d x thin d y . $

== 从联合密度函数求边际密度函数
<从联合密度函数求边际密度函数>
如果 $\( X \, Y \)$ 是连续型随机变量，且有联合密度函数
$p \( x \, y \)$，那么我们可以对另一个变量积分，得到边际密度：

$ p_X \( x \) & = integral_(- oo)^oo p \( x \, y \) thin d y\
p_Y \( y \) & = integral_(- oo)^oo p \( x \, y \) thin d x $

#strong[直观理解：] 把 $p \( x \, y \)$
看成一个"三维地形图"，$p_X \( x \)$ 就是沿着 $y$
方向"切片"后对高度积分的结果，相当于"压扁"了 $y$ 维度。

== 随机变量独立
<随机变量独立>
设 $\( X \, Y \)$
是二维随机变量，若对任意实数 $a \, b \, c \, d$，都有：
$ P \( a < X < b \, med c < Y < d \) = P \( a < X < b \) dot.op P \( c < Y < d \) $
则称 $X$ 与 $Y$ #strong[相互独立]。

#strong[解释：]知道 $X$ 在某个范围内取值，不会改变你对 $Y$ 取值的预测。

== 判断独立性的三种方法
<判断独立性的三种方法>
+ 联合分布函数满足： $ F \( x \, y \) = F_X \( x \) F_Y \( y \) $

+ 离散型：联合分布列对任意 $i \, j$ 满足 $ p_(i j) = p_i p_j $

+ 连续型：联合密度函数满足 $ p \( x \, y \) = p_X \( x \) p_Y \( y \) $

只要能写成"联合 = 边际 × 边际"的形式，就独立！

---

= 期望
---

若二维随机变量 $\( X \, Y \)$ 的分布由联合分布列
$P \( X = x_i \, Y = y_j \)$ 或联合密度函数 $p \( x \, y \)$ 给出，则
$Z = g \( X \, Y \)$ 的数学期望为：
$ E \( Z \) = cases(delim: "{", sum_i sum_j g \( x_i \, y_j \) P \( X = x_i \, Y = y_j \) \, & upright("离散情形") \,, integral_(- oo)^oo integral_(- oo)^oo g \( x \, y \) p \( x \, y \) thin d x thin d y \, & upright("连续情形") .) $

---

直观理解：把所有可能的结果 $g \( x_i \, y_j \)$
按照它们发生的可能性（概率）加权平均起来。

我们可以这样想象：

+ 毕业后，你面临多种工作类型。每份工作每月会带来：

  - 一定的 #strong[经验积累]（比如技术成长、项目锻炼），记为随机变量
    $X$；

  - 一定的 #strong[月薪收入]，记为随机变量 $Y$（单位：千元）。

+ 对你来说，钱更重要，但经验也有一定价值。你主观认为：#strong[1 个月经验
  ≈ 0.2 千元]。

+ 于是，你定义一份工作的"#strong[每月综合收益]"为：
  $ Z = 0.2 X + Y quad upright("（单位：千元/月）") . $

+ 不同行业或公司提供的 $\( X \, Y \)$ 组合不同：有的高薪但重复劳动（$X$
  小），有的成长快但工资低（$Y$ 小）。

+ 而你拿到某类工作 offer
  的概率，由你的专业、简历、面试表现等决定，这构成了 $\( X \, Y \)$
  的联合分布。

+ 那么，你期望的"平均每月综合收益"就是：
  $ E \( Z \) = sum_(i \, j) \( 0.2 x_i + y_j \) P \( X = x_i \, Y = y_j \) . $

#block[
#figure(
  align(center)[#table(
    columns: 3,
    align: (center,center,center,),
    table.header([工作类型], [每月经验 $X$], [月薪 $Y$ (千元)],),
    table.hline(),
    [A: 大厂基础岗], [2], [12],
    [B: 初创公司核心岗], [5], [8],
    [C: 稳定国企], [1], [10],
  )]
  , kind: table
  )

]

对应的每月综合收益为：
$ Z_A &= 0.2 times 2 + 12 = 12.4 \, \ 
 Z_B &= 0.2 times 5 + 8 = 9.0 \, \ 
 Z_C &= 0.2 times 1 + 10 = 10.2 . $

如果拿到这三类工作的概率分别为 0.3、0.4、0.3，则期望为：
$ E \( Z \) = 12.4 times 0.3 + 9.0 times 0.4 + 10.2 times 0.3 = 10.38 upright(" 千元/月") . $

---

#strong[关键点：] 要计算 $g \( X \, Y \)$ 的期望，必须考虑 $X$ 和 $Y$ 的
#strong[联合行为]，不能只看各自的期望。因为 $X$ 和 $Y$
可能相关，这种关系会影响总收益。即使我们知道 $E \( X \)$ 和
$E \( Y \)$，也不能简单地写成
$E \( g \( X \, Y \) \) = g \( E \( X \) \, E \( Y \) \)$。这是常见的误解！

---

两个重要特例：

- 若 $g \( X \, Y \) = X$，则
  $ E \( X \) = integral_(- oo)^oo integral_(- oo)^oo x thin p \( x \, y \) thin d x thin d y = integral_(- oo)^oo x thin p_X \( x \) thin d x . $

---

- 若 $g \( X \, Y \) = \( X - E \( X \) \)^2$，则
  $ upright(V a r) \( X \) & = E \[ X - E \( X \) \)^2 \] = integral_(- oo)^oo integral_(- oo)^oo \( x - E \( X \) \)^2 p \( x \, y \) thin d x thin d y\
   & = integral_(- oo)^oo \( x - E \( X \) \)^2 p_X \( x \) d x . $

这些结果告诉我们：\*\*联合分布包含了所有信息\*\*，我们可以通过它恢复出单个变量的所有特征数。

---

== 和的期望等于期望的和

设 $\( X \, Y \)$ 是二维随机变量，且
$E \( X \)$、$E \( Y \)$ 存在，则有：
$ E \( X + Y \) = E \( X \) + E \( Y \) . $ 该结论 #strong[不要求] $X$
与 $Y$ 独立。

这个性质告诉我们：不管两个随机变量是否相关，它们和的平均值，总是等于各自平均值之和。

---

*证明（离散情形）：*假设 $\( X \, Y \)$ 是离散型随机变量，其联合分布列为
$P \( X = x_i \, Y = y_j \) = p_(i j)$.

根据前一定理（函数的期望公式），我们有：
$ E \( X + Y \) = sum_i sum_j \( x_i + y_j \) thin p_(i j) . $

我们将括号拆开：
$ E \( X + Y \) = sum_i sum_j x_i p_(i j) + sum_i sum_j y_j p_(i j) . $

现在分别处理这两项。

#strong[第一项：]
$ sum_i sum_j x_i p_(i j) = sum_i x_i (sum_j p_(i j)) . $ 注意到
$sum_j p_(i j) = P \( X = x_i \)$，即 $X$ 的边缘分布，故有
$ sum_i x_i (sum_j p_(i j)) = sum_i x_i P \( X = x_i \) = E \( X \) . $

#strong[第二项：]
$ sum_i sum_j y_j p_(i j) = sum_j y_j (sum_i p_(i j)) = sum_j y_j P \( Y = y_j \) = E \( Y \) . $

综上， $ E \( X + Y \) = E \( X \) + E \( Y \) . $

---

*证明（连续情形）：*假设 $\( X \, Y \)$ 是连续型随机变量，联合密度为
$p \( x \, y \)$.

同样由函数期望公式：
$ E \( X + Y \) = integral_(- oo)^oo integral_(- oo)^oo \( x + y \) thin p \( x \, y \) thin d x thin d y . $

拆分为两项：
$ = integral_(- oo)^oo integral_(- oo)^oo x thin p \( x \, y \) thin d x thin d y + integral_(- oo)^oo integral_(- oo)^oo y thin p \( x \, y \) thin d x thin d y . $

对第一项，先对 $y$ 积分：
$ integral_(- oo)^oo x (integral_(- oo)^oo p \( x \, y \) thin d y) d x = integral_(- oo)^oo x thin p_X \( x \) thin d x = E \( X \) \, $
其中 $p_X \( x \) = integral_(- oo)^oo p \( x \, y \) thin d y$ 是 $X$
的边缘密度。

同理，第二项：
$ integral_(- oo)^oo y (integral_(- oo)^oo p \( x \, y \) thin d x) d y = integral_(- oo)^oo y thin p_Y \( y \) thin d y = E \( Y \) . $

因此， $ E \( X + Y \) = E \( X \) + E \( Y \) . $

---

- 证明的核心是"求和/积分的线性性"------可以把 $\( x + y \)$
  拆成两部分分别计算；

- 整个过程 #strong[没有用到] $X$ 和 $Y$ 独立的假设；

- 因此，即使 $X$ 和 $Y$ 高度相关（比如 $Y = X$），结论依然成立。

---

== 独立随机变量乘积的期望等于期望的乘积

若随机变量 $X$ 与 $Y$
相互*独立*，则有： $ E \( X Y \) = E \( X \) dot.op E \( Y \) . $
该结论可推广到 $n$ 个相互独立的随机变量：
$ E \( X_1 X_2 dots.h.c X_n \) = E \( X_1 \) E \( X_2 \) dots.h.c E \( X_n \) . $

---

*证明（连续情形）：*假设 $X$ 和 $Y$
是连续型随机变量，且相互独立。则它们的联合密度函数为：
$ p \( x \, y \) = p_X \( x \) p_Y \( y \) \, $ 其中
$p_X \( x \)$、$p_Y \( y \)$ 分别是边缘密度。

令 $g \( X \, Y \) = X Y$，可得：
$ E \( X Y \) = integral_(- oo)^oo integral_(- oo)^oo x y dot.op p \( x \, y \) thin d x thin d y . $

代入独立性条件 $p \( x \, y \) = p_X \( x \) p_Y \( y \)$：
$ = integral_(- oo)^oo integral_(- oo)^oo x y dot.op p_X \( x \) p_Y \( y \) thin d x thin d y . $

因为这里 $x$ 只出现在第一个因子中，$y$
只出现在第二个因子中，所以可以将积分拆开：
$ = (integral_(- oo)^oo x p_X \( x \) thin d x) (integral_(- oo)^oo y p_Y \( y \) thin d y) = E \( X \) dot.op E \( Y \) . $

*证明（离散情形）：*设 $X$ 和 $Y$
是离散型随机变量，且相互独立。则联合分布为：
$ P \( X = x_i \, Y = y_j \) = P \( X = x_i \) P \( Y = y_j \) . $

由定义：
$ E \( X Y \) &= sum_i sum_j x_i y_j dot.op P \( X = x_i \, Y = y_j \) \ &= sum_i sum_j x_i y_j dot.op P \( X = x_i \) P \( Y = y_j \) . $

将求和拆开：
$ E \( X Y \) &= sum_i sum_j x_i y_j dot.op P \( X = x_i \) P \( Y = y_j \) \ &= (sum_i x_i P \( X = x_i \)) (sum_j y_j P \( Y = y_j \)) \ &= E \( X \) dot.op E \( Y \) . $

---

#block[
#figure(
  align(center)[#table(
    columns: 3,
    align: (center,center,center,),
    table.header([运算], [是否可拆？], [条件],),
    table.hline(),
    [$E \( X + Y \)$], [#strong[可以]], [总是成立（无需独立）],
    [$E \( a X \)$], [#strong[可以]], [总是成立（$a$ 为常数）],
    [$E \( X Y \)$], [#strong[不可以]], [当 $X$ 与 $Y$ 独立时才能拆],
    [$E \( X^2 \)$], [#strong[不可以]], [通常 $> \[ E \( X \) \]^2$],
  )]
  , kind: table
  )

]
记住：
$ #box(stroke: black, inset: 3pt, [$ upright("加法永远能拆，乘法要独立才能拆！") $]) $
---

== 独立随机变量和的方差等于方差的和

若随机变量 $X$ 与 $Y$ 相互*独立*，则有：
$ upright(V a r) \( X plus.minus Y \) = upright(V a r) \( X \) + upright(V a r) \( Y \) . $
该结论可推广到 $n$ 个相互独立的随机变量：
$ upright(V a r) \( X_1 plus.minus X_2 plus.minus dots.h.c plus.minus X_n \) = upright(V a r) \( X_1 \) + upright(V a r) \( X_2 \) + dots.h.c + upright(V a r) \( X_n \) . $

这个性质告诉我们：当你把两个独立的随机过程相加或相减时，它们的波动（不确定性）不会抵消，只会*叠加*。
方差是"误差的平方的期望"，所以即使正负误差可能抵消，它们的"大小"仍然累加。

---

*应用：多次称重提高精度*

假设你要称一个物体的质量 $mu$，但由于秤有误差，每次称量结果都不同。

设第 $i$ 次称量的结果为 $X_i$，它满足：

- $E \( X_i \) = mu$（无系统偏差）；

- $upright(V a r) \( X_i \) = sigma^2$（每次都有随机误差）；

- 且各次称量相互独立（误差之间无关）。

现在你重复称了 $n$ 次，取平均值：
$ macron(X) = 1 / n \( X_1 + X_2 + dots.h.c + X_n \) . $

那么：
$ upright(V a r) \( macron(X) \) = upright(V a r) (1 / n sum_(i = 1)^n X_i) = 1 / n^2 sum_(i = 1)^n upright(V a r) \( X_i \) = 1 / n^2 dot.op n sigma^2 = sigma^2 / n . $
---
于是

$ upright(V a r) \( macron(X) \) = ( upright(V a r) (X)) / n $

#strong[这意味着：]

- 你称得越多，平均值的波动越小；

- 精度提高了！

- 这就是为什么科学实验中要"重复测量取平均"。

---

*证明（基于前两性质）：*我们从方差的定义出发：
$ upright(V a r) \( X plus.minus Y \) = E #scale(x: 120%, y: 120%)[\(] \( X plus.minus Y - E \( X plus.minus Y \) \)^2 #scale(x: 120%, y: 120%)[\)] . $

先计算期望：
$ E \( X plus.minus Y \) = E \( X \) plus.minus E \( Y \) \, $ 所以
$ X plus.minus Y - E \( X plus.minus Y \) = \( X - E \( X \) \) plus.minus \( Y - E \( Y \) \). $

令 $A = X - E \( X \)$，$B = Y - E \( Y \)$，则：
$ upright(V a r) \( X plus.minus Y \) &= E \[ \( A plus.minus B \)^2 \] \ &= E \( A^2 plus.minus 2 A B + B^2 \) \ &= E \( A^2 \) plus.minus 2 E \( A B \) + E \( B^2 \) . $

注意到： $E \( A^2 \) = upright(V a r) \( X \)$ 且
$E \( B^2 \) = upright(V a r) \( Y \)$， 可得
$ upright(V a r) \( X plus.minus Y \) = upright(V a r) \( X \) + upright(V a r) \( Y \) plus.minus 2 E \( A B \) . $

现在看交叉项 $E \( A B \)$. 由于
$A = X - E \( X \)$，$B = Y - E \( Y \)$，而 $X$ 与 $Y$ 独立，所以 $A$
与 $B$ 也独立（因为常数不影响独立性）。于是：
$ E \( A B \) = E \( A \) E \( B \) = 0 dot.op 0 = 0 . $

因此：
$ upright(V a r) \( X plus.minus Y \) &= upright(V a r) \( X \) + upright(V a r) \( Y \) plus.minus 2 E \( A B \) \ &= upright(V a r) \( X \) + upright(V a r) \( Y \) . $

---

#strong[注意：] 这个性质 #strong[只对独立变量成立]！如果 $X$ 和 $Y$
有关联（比如 $Y = X$），则方差不会简单相加。

例如：若 $Y = X$，则 $X + Y = 2 X$，所以：
$ upright(V a r) \( X + Y \) = upright(V a r) \( 2 X \) = 4 upright(V a r) \( X \) \, $
而
$upright(V a r) \( X \) + upright(V a r) \( Y \) = 2 upright(V a r) \( X \)$，两者不等！
---
#strong[另一个提醒：]
$ sigma \( X plus.minus Y \) eq.not sigma \( X \) + sigma \( Y \) \, $
因为标准差是方差的平方根，不能直接相加！

事实上：
$ sigma \( X plus.minus Y \) = sqrt(upright(V a r) \( X \) + upright(V a r) \( Y \)) lt.eq sigma \( X \) + sigma \( Y \) . $

---

== 例题

已知随机变量 $X_1 \, X_2 \, X_3$ 相互独立，且：
$ X_1 tilde.op U \( 0 \, 6 \) \, quad X_2 tilde.op N \( 1 \, 3 \) \, quad X_3 tilde.op upright(E x p) \( 3 \) . $
令 $Y = X_1 - 2 X_2 + 3 X_3$，求 $E \( Y \)$、$upright(V a r) \( Y \)$
和 $sigma \( Y \)$。

---

#strong[解：]

我们先回顾一下这些常见分布的期望和方差公式（非常重要！在书上第106页）：

#block[
#figure(
  align(center)[#table(
    columns: 3,
    align: (center,center,center,),
    table.header([分布], [期望 $E \( X \)$], [方差
      $upright(V a r) \( X \)$],),
    table.hline(),
    [均匀分布
    $U \( a \, b \)$], [$frac(a + b, 2)$], [$frac(\( b - a \)^2, 12)$],
    [正态分布 $N \( mu \, sigma^2 \)$], [$mu$], [$sigma^2$],
    [指数分布
    $upright(E x p) \( lambda \)$], [$1 / lambda$], [$1 / lambda^2$],
  )]
  , kind: table
  )

]
现在我们逐个计算每个变量的期望和方差：

$X_1 tilde.op U \( 0 \, 6 \)$：
$ E \( X_1 \) = frac(0 + 6, 2) = 3 \, quad upright(V a r) \( X_1 \) = frac(\( 6 - 0 \)^2, 12) = 36 / 12 = 3 . $

$X_2 tilde.op N \( 1 \, 3 \)$：
$ E \( X_2 \) = 1 \, quad upright(V a r) \( X_2 \) = 3 . $

$X_3 tilde.op upright(E x p) \( 3 \)$：
$ E \( X_3 \) = 1 / 3 \, quad upright(V a r) \( X_3 \) = 1 / 3^2 = 1 / 9 . $

由于 $X_1 \, X_2 \, X_3$ 相互独立，我们可以使用期望和方差的运算性质。

#strong[第一步：求期望 $E \( Y \)$]

由期望的线性性（无需独立性）：
$ E \( Y \) &= E \( X_1 - 2 X_2 + 3 X_3 \) = E \( X_1 \) - 2 E \( X_2 \) + 3 E \( X_3 \) \ &= 3 - 2 times 1 + 3 times 1 / 3 = 3 - 2 + 1 = #box(stroke: black, inset: 3pt, [$ 2 $]) . $

#strong[第二步：求方差 $upright(V a r) \( Y \)$]

注意：方差只在独立时才能拆分，且系数要平方！

$ upright(V a r) \( Y \) &= upright(V a r) \( X_1 - 2 X_2 + 3 X_3 \) \ &= upright(V a r) \( X_1 \) + \( - 2 \)^2 upright(V a r) \( X_2 \) + \( 3 \)^2 upright(V a r) \( X_3 \) \ &= 3 + 4 times 3 + 9 times 1 / 9 = 3 + 12 + 1 = #box(stroke: black, inset: 3pt, [$ 16 $]) . $

#strong[第三步：求标准差 $sigma \( Y \)$]

$ sigma \( Y \) = sqrt(upright(V a r) \( Y \)) = sqrt(16) = #box(stroke: black, inset: 3pt, [$ 4 $]) . $

#strong[总结：]
$ E \( Y \) = 2 \, quad upright(V a r) \( Y \) = 16 \, quad sigma \( Y \) = 4 . $

---

- 期望可以线性拆分：$E \( a X + b Y \) = a E \( X \) + b E \( Y \)$，#strong[无论是否独立]；

- 方差只能在独立时拆分：$upright(V a r) \( a X + b Y \) = a^2 upright(V a r) \( X \) + b^2 upright(V a r) \( Y \)$，#strong[必须独立]；

- 常见分布的期望和方差必须熟记，这是应试的普通要求。

== 二项分布的期望与方差

设随机变量 $X tilde.op b \( n \, p \)$，即进行 $n$
次独立重复试验，每次成功概率为 $p$，记成功次数为 $X$。

我们要计算 $E \( X \)$ 和 $upright(V a r) \( X \)$。

#strong[传统方法]（第二章已讲）：通过定义计算，过程较复杂。

#strong[新方法]：利用"分解思想"，把总成功次数拆成多个"单次试验是否成功"的指示变量之和。

#strong[第一步：引入指示变量]

令 $X_1 \, X_2 \, dots.h \, X_n$ 是 $n$ 个独立的随机变量，其中：
$ X_i = cases(delim: "{", 1 \, & upright("第 ") i upright(" 次试验成功") \,, 0 \, & upright("第 ") i upright(" 次试验失败") .) $

则每个 $X_i$ 服从
*0-1分布*（也叫伯努利分布）$b \( 1 \, p \)$，即：
$ P \( X_i = 1 \) = p \, quad P \( X_i = 0 \) = 1 - p . $

而总成功次数就是： $ X = X_1 + X_2 + dots.h.c + X_n . $

#strong[这就像]你投篮 $n$ 次，每次命中率 $p$，总命中数
$X tilde.op b \( n \, p \)$； 每次投篮的成功与否是一个"开关"（0 或 1）；
总命中数 $X$ 就是这些"开关"的和。

#strong[第二步：计算每个 $X_i$ 的期望和方差]

由于 $X_i tilde.op b \( 1 \, p \)$，我们有：
$ E \( X_i \) = 1 dot.op p + 0 dot.op \( 1 - p \) = p \, $
$ upright(V a r) \( X_i \) = E \( X_i^2 \) - \[ E \( X_i \) \]^2 = p - p^2 = p \( 1 - p \) . $

#strong[第三步：利用期望和方差的性质]

因为 $X_1 \, X_2 \, dots.h \, X_n$ 相互独立（试验独立），我们可以使用：

期望的线性性（总是成立）：
$ E \( X \) = E (sum_(i = 1)^n X_i) = sum_(i = 1)^n E \( X_i \) = sum_(i = 1)^n p = n p . $

方差的可加性（因独立）：
$ upright(V a r) \( X \) = upright(V a r) (sum_(i = 1)^n X_i) = sum_(i = 1)^n upright(V a r) \( X_i \) = sum_(i = 1)^n p \( 1 - p \) = n p \( 1 - p \) . $

#strong[结论：]
$ #box(stroke: black, inset: 3pt, [$ E \( X \) = n p \, quad upright(V a r) \( X \) = n p \( 1 - p \) . $]) $

= 协方差
---
设 $\( X \, Y \)$ 是一个二维随机变量，若数学期望
$ E \[ \( X - E \( X \) \) \( Y - E \( Y \) \) \] $ 存在，则称此期望为 $X$
与 $Y$ 的 #strong[协方差]，记为：
$ upright(C o v) \( X \, Y \) = E \[ \( X - E \( X \) \) \( Y - E \( Y \) \) \] . $

特别地，有： $ upright(C o v) \( X \, X \) = upright(V a r) \( X \) . $

协方差的直观含义：两个变量是否"*同进同退，一荣俱荣，一损俱损*"？它衡量的是：当
$X$ 偏离其平均值时，$Y$ 是否也倾向于以相同方向偏离其平均值。

- $X - E \( X \)$：表示 $X$ 的"偏差"——比平均高还是低；

- $Y - E \( Y \)$：表示 $Y$ 的"偏差"；

- 它们的乘积：$\( X - E \( X \) \) \( Y - E \( Y \) \)$
  表示两者"同步偏离"的程度。

---

假设你在研究"每月工作时间 $X$（小时）"和"月薪 $Y$（千元）"之间的关系。

#figure(
  align(center)[#table(
    columns: 5,
    align: (auto,auto,auto,auto,auto,),
    table.header([情况], [X 偏差], [Y 偏差], [乘积], [含义],),
    table.hline(),
    [A: 高薪+长工时], [正], [正], [正], [工作越久，工资越高 → 正相关],
    [B: 低薪+短工时], [负], [负], [正], [工作少，收入低 → 也正相关],
    [C: 高薪+短工时], [正], [负], [负], [钱多事少 → 负相关],
    [D: 低薪+长工时], [负], [正], [负], [钱少事多 → 负相关],
  )]
  , kind: table
  )

#strong[协方差就是这些乘积的长期平均值。]

- 如果多数情况是 A 和 B 类型（同增同减），则
  $upright(C o v) \( X \, Y \) > 0$ → 正相关；

- 如果多数是 C 和 D 类型（一增一减），则
  $upright(C o v) \( X \, Y \) < 0$ → 负相关；

- 如果没有明显趋势，则 $upright(C o v) \( X \, Y \) approx 0$ → 不相关。
---
我们有如下定义：

- 当 $upright(C o v) \( X \, Y \) > 0$：称 $X$ 与 $Y$
  #strong[正相关]，即它们有同时增加或同时减少的趋势；

- 当 $upright(C o v) \( X \, Y \) < 0$：称 $X$ 与 $Y$
  #strong[负相关]，即一个增加时另一个倾向于减少；

- 当 $upright(C o v) \( X \, Y \) = 0$：称 $X$ 与 $Y$
  #strong[不相关]，但这不代表完全无关！可能只是无线性关系。
---
#strong[提醒：]

- 协方差的单位是"$X$ 的单位 × $Y$ 的单位"，比如"年·千元"，不好比较大小；

- 我们后面会引入"相关系数"来标准化它，使其在 $\[ - 1 \, 1 \]$ 之间；

- 独立 ⇒ 不相关（即
  $upright(C o v) \( X \, Y \) = 0$），但反过来不一定成立。



== 协方差的计算公式

设 $\( X \, Y \)$ 是二维随机变量，则有：
$ upright(C o v) \( X \, Y \) = E \( X Y \) - E \( X \) E \( Y \) . $

*证明：*由协方差的定义：
$ upright(C o v) \( X \, Y \) = E \[ \( X - E \( X \) \) \( Y - E \( Y \) \) \] . $

展开括号：
$ = E \[ X Y - X dot.op E \( Y \) - Y dot.op E \( X \) + E \( X \) E \( Y \) \] . $

利用期望的线性性（可拆分）：
$ upright(C o v) \( X \, Y \) &= E \[ X Y - X dot.op E \( Y \) - Y dot.op E \( X \) + E \( X \) E \( Y \) \] \
&= E \( X Y \) - E \( X \) E \( Y \) - E \( Y \) E \( X \) + E \( X \) E \( Y \) \ &= E \( X Y \) - E \( X \) E \( Y \) . $

#strong[注：] 这个公式的好处是：只要知道
$E \( X Y \)$、$E \( X \)$、$E \( Y \)$，就可以直接计算协方差，无需先算偏差。


*推论：*
若随机变量 $X$ 与 $Y$ 相互独立，则 $upright(C o v) \( X \, Y \) = 0$。

但反之不成立：$upright(C o v) \( X \, Y \) = 0$ 不足以推出 $X$ 与 $Y$
独立。

---

*证明（独立 ⇒ 不相关）：*由独立性知
$E \( X Y \) = E \( X \) E \( Y \)$，代入上一性质：
$ upright(C o v) \( X \, Y \) &= E \( X Y \) - E \( X \) E \( Y \) \ &= E \( X \) E \( Y \) - E \( X \) E \( Y \) = 0 . $



== 不相关也不独立的例子

你在棋盘上玩一个游戏：

+ 你行动的时候要先掷硬币决定是 左/右 移动还是 上/下 移动；

+ 然后再掷硬币决定是前进一步还是后退一步；

+ 如果你左右移动（$X = plus.minus 1$），就不能上下移动（$Y = 0$）；

+ 如果你上下移动（$Y = plus.minus 1$），就不能左右移动（$X = 0$）；

所以你的两种移动"互斥"了，它们有关联，但没有线性关系。
---
二维随机变量 $\( X \, Y \)$ 的联合分布如下：以等概率 $1 / 4$
取下列四个点：
$ \( 1 \, 0 \) \, quad \( 0 \, 1 \) \, quad \( - 1 \, 0 \) \, quad \( 0 \, - 1 \) . $

这就像在一个坐标系中，四个点分别位于 $x$ 轴和 $y$
轴上，形成一个"十字形"。

#strong[第一步：计算期望]

由于对称性，我们可以直接看出：

- $X$ 的可能取值为 $- 1 \, 0 \, 1$，出现的概率分别是 $1 / 4, 1/2, 1/4$；

- $Y$ 的可能取值为 $- 1 \, 0 \, 1$，同样出现的概率分别是 $1 / 4,  1/2, 1/ 4$.

所以：
$ E \( X \) &= \( - 1 \) dot.op 1 / 4 + 0 dot.op 1 / 2 + 1 dot.op 1 / 4 = 0 \, \ E \( Y \) &= \( - 1 \) dot.op 1 / 4 + 0 dot.op 1 / 2 + 1 dot.op 1 / 4 = 0 . $
---
#strong[第二步：计算 $E \( X Y \)$]

注意：在所有可能的取值中，$X$ 和 $Y$ 中总有一个是 0！

- 当 $\( X \, Y \) = \( 1 \, 0 \)$：$X Y = 0$

- 当 $\( X \, Y \) = \( 0 \, 1 \)$：$X Y = 0$

- 当 $\( X \, Y \) = \( - 1 \, 0 \)$：$X Y = 0$

- 当 $\( X \, Y \) = \( 0 \, - 1 \)$：$X Y = 0$

所以 $X Y equiv 0$，因此： $E \( X Y \) = 0 .$

#strong[第三步：计算协方差]
$ upright(C o v) \( X \, Y \) = E \( X Y \) - E \( X \) E \( Y \) = 0 - 0 dot.op 0 = 0 . $

所以 $X$ 与 $Y$ #strong[不相关]。

#strong[第四步：判断是否独立]

我们来举反例：若 $X$ 与 $Y$ 独立，则应有：
$ P \( X = x \, Y = y \) = P \( X = x \) P \( Y = y \) . $

取一个具体值检验：比如 $X = 1$，则只可能出现在 $\( 1 \, 0 \)$，所以：
$ P \( X = 1 \, Y = 0 \) = 1 / 4 . $

而边缘概率：

- $P \( X = 1 \) = 1 / 4$，

- $P \( Y = 0 \) = P \( \( 1 \, 0 \) \) + P \( \( - 1 \, 0 \) \) = 1 / 4 + 1 / 4 = 1 / 2$.

所以：
$ P \( X = 1 \) P \( Y = 0 \) = 1 / 4 times 1 / 2 = 1 / 8 eq.not 1 / 4 = P \( X = 1 \, Y = 0 \) . $

因此，$X$ 与 $Y$ #strong[不独立]。

#strong[结论：]

- $upright(C o v) \( X \, Y \) = 0$ → 不相关；

- 但 $X$ 与 $Y$ 不独立；

- 因为当 $X eq.not 0$ 时，$Y$ 必须为 0；反之亦然。

这说明："不相关"只是排除了*线性依赖*，但不能排除*其他形式的依赖*。

因此：
$ #box(stroke: black, inset: 3pt, [$ upright("独立") arrow.r.double upright("不相关") \, quad upright("但") quad upright("不相关") ⇏ upright("独立") . $]) $

- 协方差为零，只表示"无线性关系"，不代表完全无关；

- 要判断独立性，必须看联合分布是否等于边缘分布乘积。



== 从"独立"到"不相关"：条件的弱化

前面我们讲过：
$ upright("若 ") X upright(" 与 ") Y upright(" 独立") arrow.r.double E \( X Y \) = E \( X \) E \( Y \) . $

现在我们知道：*独立 ⇒ 不相关*，但反之不成立。

那么问题来了：能否把"独立"这个强条件，换成更弱的"不相关"？

答案是：在这里可以！

具体来说，如果我们知道：
$ upright(C o v) \( X \, Y \) = 0 quad upright("即") quad E \( X Y \) = E \( X \) E \( Y \) \, $
那么即使 $X$ 与 $Y$ 不独立，我们仍然有：
$ E \( X Y \) = E \( X \) E \( Y \) . $

换句话说："不相关"已经足以保证乘积的期望等于期望的乘积。

#strong[总结：
$ #box(stroke: black, inset: 3pt, [$ upright("独立") arrow.r.double upright("不相关") arrow.r.double E \( X Y \) = E \( X \) E \( Y \) . $]) $]



== 任意随机变量和的方差

对任意二维随机变量 $\( X \, Y \)$，有：
$ upright(V a r) \( X plus.minus Y \) = upright(V a r) \( X \) + upright(V a r) \( Y \) plus.minus 2 upright(C o v) \( X \, Y \) . $



*证明：*由方差的定义可知
$ upright(V a r) \( X plus.minus Y \) = E \[ \( X plus.minus Y - E \( X plus.minus Y \) \)^2 \] . $

先计算期望：
$E \( X plus.minus Y \) = E \( X \) plus.minus E \( Y \) \, quad $ 所以 $ X plus.minus Y - E \( X plus.minus Y \) = \( X - E \( X \) \) plus.minus \( Y - E \( Y \) \) . $

令 $A = X - E \( X \)$，$B = Y - E \( Y \)$，则：
$ upright(V a r) \( X plus.minus Y \) &= E \[ \( A plus.minus B \)^2 \] \ &= E \( A^2 plus.minus 2 A B + B^2 \) \ &= E \( A^2 \) plus.minus 2 E \( A B \) + E \( B^2 \) . $

注意到： $E \( A^2 \) = upright(V a r) \( X \)$，
$E \( B^2 \) = upright(V a r) \( Y \)$，$E \( A B \) = upright(C o v) \( X \, Y \)$，因此：
$ upright(V a r) \( X plus.minus Y \) = upright(V a r) \( X \) + upright(V a r) \( Y \) plus.minus 2 upright(C o v) \( X \, Y \) . $

- #strong[当 $upright(C o v) \( X \, Y \) > 0$（正相关）]： $X$ 和 $Y$
  有同向变动的趋势； 当一个变大时，另一个也倾向于变大； 所以 $X + Y$
  的波动会 #strong[放大]； 此时
  $upright(V a r) \( X + Y \) > upright(V a r) \( X \) + upright(V a r) \( Y \)$.

- #strong[当 $upright(C o v) \( X \, Y \) < 0$（负相关）]： $X$
  增加时，$Y$ 趋于减少； 它们互相"抵消"； 所以 $X + Y$ 的波动会
  #strong[减小]； 此时
  $upright(V a r) \( X + Y \) < upright(V a r) \( X \) + upright(V a r) \( Y \)$.

- #strong[当 $upright(C o v) \( X \, Y \) = 0$（不相关）]：
  两者无线性关系； 总波动等于各自波动之和； 即
  $upright(V a r) \( X + Y \) = upright(V a r) \( X \) + upright(V a r) \( Y \)$.

---

假设你有两个投资项目：

- $X$：股票 A，预期收益高，但波动大；

- $Y$：股票 B，预期收益中等，波动中等。

你想把钱投在 $X + Y$ 上，关心总风险（即方差）。

- 如果 A 和 B 都随大盘涨跌（正相关），那么
  $upright(C o v) \( X \, Y \) > 0$，总风险会 #strong[增加]；

- 如果 A 涨时 B 跌（负相关），比如一个是科技股，一个是能源股，那么
  $upright(C o v) \( X \, Y \) < 0$，总风险会
  #strong[降低]；这就是"分散投资"的原理：通过负相关的资产来降低整体风险。

---

回顾之前学过的性质 3.4.3：
$ upright("若 ") X upright(" 与 ") Y upright(" 独立，则 ") upright(V a r) \( X plus.minus Y \) = upright(V a r) \( X \) + upright(V a r) \( Y \) . $

现在我们知道：这是本性质的一个特例！

因为独立 ⇒ 不相关 ⇒ $upright(C o v) \( X \, Y \) = 0$，所以：
$ upright(V a r) \( X plus.minus Y \) = upright(V a r) \( X \) + upright(V a r) \( Y \) plus.minus 2 times 0 = upright(V a r) \( X \) + upright(V a r) \( Y \) . $

== 协方差 $approx$ 内积

设 $X \, Y \, Z$ 为任意随机变量，$a \, b$ 为常数。则协方差具有以下性质：

+ #strong[对称性：]
  $upright(C o v) \( X \, Y \) = upright(C o v) \( Y \, X \)$；

+ #strong[与常数的协方差为零：] $upright(C o v) \( X \, a \) = 0$；

+ #strong[齐次性：]
  $upright(C o v) \( a X \, b Y \) = a b thin upright(C o v) \( X \, Y \)$；

+ #strong[对单变量的线性：]
  $upright(C o v) \( X + Y \, Z \) = upright(C o v) \( X \, Z \) + upright(C o v) \( Y \, Z \)$。

---

证明#strong[：]

#strong[性质 3.4.7（对称性）：]

由协方差定义：
$ upright(C o v) \( X \, Y \) = E \[ \( X - E \( X \) \) \( Y - E \( Y \) \) \] . $

交换 $X$ 和 $Y$ 的位置：
$ upright(C o v) \( Y \, X \) = E \[ \( Y - E \( Y \) \) \( X - E \( X \) \) \] = upright(C o v) \( X \, Y \) \, $
因为乘法交换律成立。

#strong[性质 3.4.8（与常数的协方差为零）：]

设 $a$ 为常数，则 $E \( a \) = a$，所以：
$ upright(C o v) \( X \, a \) = E \[ \( X - E \( X \) \) \( a - a \) \] = E \[ \( X - E \( X \) \) dot.op 0 \] = 0 . $
---
#strong[性质 3.4.9（齐次性）：]

$ upright(C o v) \( a X \, b Y \) &= E \[ \( a X - E \( a X \) \) \( b Y - E \( b Y \) \) \] \ &= E \[ \( a X - a E \( X \) \) \( b Y - b E \( Y \) \) \] \ &= E \[ a \( X - E \( X \) \) dot.op b \( Y - E \( Y \) \) \] \ &= a b thin E \[ \( X - E \( X \) \) \( Y - E \( Y \) \) \] \ &= a b thin upright(C o v) \( X \, Y \) . $
---
#strong[性质 3.4.10（对单变量的线性）：]

由性质 3.4.4：
$ upright(C o v) \( X + Y \, Z \) &= E \[ \( X + Y \) Z \] - E \( X + Y \) E \( Z \) \ &= E \( X Z \) + E \( Y Z \) - E \( X \) E \( Z \) - E \( Y \) E \( Z \) \ &= \[ E \( X Z \) - E \( X \) E \( Z \) \] + \[ E \( Y Z \) - E \( Y \) E \( Z \) \] \ &= upright(C o v) \( X \, Z \) + upright(C o v) \( Y \, Z \) . $

---

这些性质意味着什么？

这些看似简单的性质，实际上揭示了协方差是一个*深刻的代数结构*。

我们可以把 $Omega$
上所有随机变量看作一个"空间"中的元素，而协方差是一个定义在这个空间上的"二元函数"。

它满足：

- 对称性：$upright(C o v) \( X \, Y \) = upright(C o v) \( Y \, X \)$；
- 线性：对每个变量都是线性的（如性质 3.4.9 和 3.4.10）；
- 在常数上退化：$upright(C o v) \( X \, a \) = 0$。

这说明：*协方差是一个"对称双线性型"*（bilinear symmetric
form），类似于向量空间中的内积。

#strong[类比理解：]

- 在几何中，两个向量的点积 $arrow(a) dot.op arrow(b)$
  是一个数，表示它们的夹角和长度关系；

- 在概率中，协方差 $upright(C o v) \( X \, Y \)$
  是一种"随机变量之间的*点积*"，衡量它们的线性依赖程度。

虽然协方差不是严格意义上的内积（因为它可以为负），但它具有类似的代数性质。

= 相关系数
---
设 $\( X \, Y \)$ 是一个二维随机变量，且
$upright(V a r) \( X \) = sigma_x^2 > 0$，$upright(V a r) \( Y \) = sigma_y^2 > 0$。则称：
$ upright(C o r r) \( X \, Y \) = frac(upright(C o v) \( X \, Y \), sqrt(upright(V a r) \( X \)) sqrt(upright(V a r) \( Y \))) = frac(upright(C o v) \( X \, Y \), sigma_x sigma_y) $
为 $X$ 与 $Y$ 的 #strong[（线性）相关系数]。

- 协方差就像两个向量的内积；

- 相关系数就像两个向量的夹角的余弦。



== 为什么要引入相关系数？

协方差 $upright(C o v) \( X \, Y \)$
虽然能判断正负相关，但它有一个严重问题：*有量纲*！

#strong[举个例子：]

- 设 $X$：身高（单位：米），$Y$：体重（单位：千克），则
  $upright(C o v) \( X \, Y \)$ 的单位是
  $upright("m") dot.op upright("kg")$；

- 如果换算成厘米和克：$X' = 100 X$，$Y' = 1000 Y$，那么：
  $ upright(C o v) \( X' \, Y' \) &= upright(C o v) \( 100 X \, 1000 Y \) \ &= 100 times 1000 times upright(C o v) \( X \, Y \) = 10^5 times upright(C o v) \( X \, Y \) . $

- 协方差的值变了！但实际关系没变！

#strong[解决方案：标准化！]

我们把 $X$ 和 $Y$ 都"标准化"为无量纲的变量：
$ X^(*) = frac(X - mu_x, sigma_x) \, quad Y^(*) = frac(Y - mu_y, sigma_y) \, $
其中 $mu_x = E \( X \)$，$sigma_x = sqrt(upright(V a r) \( X \))$，同理
$mu_y \, sigma_y$。

这些标准化变量的期望为 0，方差为 1，单位消失。

此时它们的协方差就是：
$ upright(C o v) \( X^(*) \, Y^(*) \) = upright(C o v) (frac(X - mu_x, sigma_x) \, frac(Y - mu_y, sigma_y)) = frac(upright(C o v) \( X \, Y \), sigma_x sigma_y) = upright(C o r r) \( X \, Y \) . $

#strong[结论：]
$ #box(stroke: black, inset: 3pt, [$ upright("相关系数 ") upright(C o r r) \( X \, Y \) upright(" 就是两个标准化变量的协方差。") $]) $

它消除了量纲影响，是一个纯数字，范围在 $\[ - 1 \, 1 \]$
之间，可以用来比较不同变量之间的线性相关强度。

== 相关系数 $=$ 夹角余弦

如何想象 $upright(C o r r) in \[ - 1 \, 1 \]$？

我们可以把相关系数看作两个向量之间的"夹角余弦"。

- $upright(C o r r) = 1$：完全正相关，像两个方向相同的向量；

- $upright(C o r r) = - 1$：完全负相关，像两个方向相反的向量；

- $upright(C o r r) = 0$：无线性关系，像两个方向垂直的向量；

- $upright(C o r r) = 0.8$：强正相关；

- $upright(C o r r) = 0.3$：弱正相关。

---

#strong[提醒：]

- 相关系数只衡量*线性关系*；

- 它不能反映非线性关系（如 $Y = X^2$）；

- 更不能说明因果关系（相关 ≠ 因果）。

== 相关系数的取值范围

设 $X \, Y$ 是方差为正的随机变量，则其相关系数满足：
$ - 1 lt.eq upright(C o r r) \( X \, Y \) lt.eq 1 . $



*证明（利用和的方差公式，以及方差非负性）：*



考虑标准化后的变量（它们均值为 0，方差为 1）：
$ X^(*) = frac(X - E \( X \), sigma_X) \, quad Y^(*) = frac(Y - E \( Y \), sigma_Y) \, $
其中
$sigma_X = sqrt(upright(V a r) \( X \)) > 0$，$sigma_Y = sqrt(upright(V a r) \( Y \)) > 0$。

注意： $upright(V a r) \( X^(*) \) = upright(V a r) \( Y^(*) \) = 1$，
$upright(C o v) \( X^(*) \, Y^(*) \) = upright(C o r r) \( X \, Y \)$.

现在考虑任意实数 $t$，构造新变量： $ Z_t = X^(*) + t Y^(*) . $

由于方差恒非负，有：
$ upright(V a r) \( Z_t \) = upright(V a r) \( X^(*) + t Y^(*) \) gt.eq 0 . $

在这里，"方差不能为负"就是概率世界的"物理定律"，就像说："在我们生活的宇宙中，一个向量的长度不可能是负的。"

利用方差展开公式（性质 3.4.6）：
$ upright(V a r) \( X^(*) + t Y^(*) \)  &= upright(V a r) \( X^(*) \) + t^2 upright(V a r) \( Y^(*) \) + 2 t thin upright(C o v) \( X^(*) \, Y^(*) \) \ &= 1 + t^2 + 2 t dot upright(C o r r) \( X \, Y \) . $

因此，对所有实数 $t$，有：
$ 1 + 2 dot upright(C o r r) \( X \, Y \) dot.op t + t^2 gt.eq 0 . $

这是一个关于 $t$
的二次函数：$f \( t \) = t^2 + 2 dot upright(C o r r) \( X \, Y \) dot.op t + 1$。

要使它对所有 $t in bb(R)$ 都非负，其判别式必须小于等于零：
$ Delta = \( 2 dot upright(C o r r) \( X \, Y \) \)^2 - 4 dot.op 1 dot.op 1 = 4 dot upright(C o r r) \( X \, Y \)^2 - 4 lt.eq 0 . $

解得：
$ upright(C o r r) \( X \, Y \)^2 lt.eq 1 quad arrow.r.double quad \| upright(C o r r) \( X \, Y \) \| lt.eq 1 . $

这就完成了证明。



#strong[等号成立的条件：] 当 $Delta = 0$ 时，即
$upright(C o r r) \( X \, Y \) = plus.minus 1$，此时二次函数有唯一零点，意味着存在某个
$t_0$ 使得：
$ upright(V a r) \( X^(*) + t_0 Y^(*) \) = 0 quad arrow.r.double quad X^(*) + t_0 Y^(*) = upright("常数") . $

也就是说，$X^(*)$ 和 $Y^(*)$ 几乎存在*严格的线性关系*，即：
$ Y = a X + b quad upright("（几乎必然）") . $

这也解释了为什么 $\| upright(C o r r) \( X \, Y \) \| = 1$
对应完全线性相关。






*定理：*设 $X \, Y$ 是方差为正的随机变量，则：
$ upright(C o r r) \( X \, Y \) = plus.minus 1 quad upright("当且仅当") quad P \( Y = a X + b \) = 1 \, $
其中 $a eq.not 0$，且：

- 若 $upright(C o r r) \( X \, Y \) = 1$，则 $a > 0$；若 $upright(C o r r) \( X \, Y \) = - 1$，则 $a < 0$。

== 例题

假设你有一笔资金总额为
1（单位可视为万元或任意金额），计划在以下两种资产间分配：

- #strong[余额宝]：代表低风险货币基金；

- #strong[纳斯达克指数基金]：代表高成长性的海外权益类资产。

设：

- $x$ 是投入余额宝的资金比例（$0 lt.eq x lt.eq 1$）；

- 则 $1 - x$ 是投入纳斯达克指数基金的比例。

我们不假设任何具体分布，仅基于*历史经验数据*估计（并非当前数据）：

#block[
#figure(
  align(center)[#table(
    columns: 3,
    align: (left,center,center,),
    table.header([资产], [年化收益率（期望）], [年化波动率（标准差）],),
    table.hline(),
    [余额宝 $X$], [$mu_1 = 1.0 % = 0.01$], [$sigma_1 = 0.5 % = 0.005$],
    [纳斯达克指数基金 $Y$], [$mu_2 = 15.0 % = 0.15$], [$sigma_2 = 8.0 % = 0.08$],
  )]
  , kind: table
  )

]
根据过去几年的市场表现（例如：中国货币政策宽松导致货币基金收益下行，同时美股科技股因AI热潮上涨），两者呈现*一定程度的负相关*。我们假设相关系数为：
$rho = - 0.3.$

记组合收益率为 $Z = x X + \( 1 - x \) Y$，其中 $X$、$Y$
分别表示两类资产的投资量。

#strong[目标：求使组合风险（即方差）最小的投资比例 $x^(*)$。]

#strong[第一步：写出组合方差]

由方差展开公式：
$ upright(V a r) \( Z \) = x^2 sigma_1^2 + \( 1 - x \)^2 sigma_2^2 + 2 x \( 1 - x \) rho sigma_1 sigma_2 . $


#strong[第二步：求最小方差点]

将组合方差表达式整理为关于 $x$ 的二次函数。 先写出完整表达式：
$ upright(V a r) \( Z \) = x^2 sigma_1^2 + \( 1 - 2 x + x^2 \) sigma_2^2 + 2 x \( 1 - x \) rho sigma_1 sigma_2 . $

展开各项：
$ = x^2 sigma_1^2 + sigma_2^2 - 2 x sigma_2^2 + x^2 sigma_2^2 + 2 x rho sigma_1 sigma_2 - 2 x^2 rho sigma_1 sigma_2 . $

合并同类项，按 $x^2$、$x$、常数项整理：
$ upright(V a r) \( Z \) = underbrace(#scale(x: 120%, y: 120%)[\(] sigma_1^2 + sigma_2^2 - 2 rho sigma_1 sigma_2 #scale(x: 120%, y: 120%)[\)], A) x^2 + underbrace(#scale(x: 120%, y: 120%)[\(] - 2 sigma_2^2 + 2 rho sigma_1 sigma_2 #scale(x: 120%, y: 120%)[\)], B) x + underbrace(sigma_2^2, C) . $

这是一个关于 $x$ 的*二次函数*：$f \( x \) = A x^2 + B x + C$。

我们关心它的*最小值点*。为此，先判断开口方向：

系数 $A = sigma_1^2 + sigma_2^2 - 2 rho sigma_1 sigma_2$；注意到：
$ A = \( sigma_1 - rho sigma_2 \)^2 + sigma_2^2 \( 1 - rho^2 \) gt.eq 0 \, $
可见通常有 $A > 0$； 更直观地，代入数值验证：
$ A &= \( 0.005 \)^2 + \( 0.08 \)^2 - 2 \( - 0.3 \) \( 0.005 \) \( 0.08 \) \ &= 0.000025 + 0.0064 + 0.00024 = 0.006665 > 0 . $

因此，*抛物线开口向上*，其图像为"U"形。

根据二次函数极值公式，最小值点为：
$ x^(*) = - frac(B, 2 A) = frac(2 sigma_2^2 - 2 rho sigma_1 sigma_2, 2 \( sigma_1^2 + sigma_2^2 - 2 rho sigma_1 sigma_2 \)) = frac(sigma_2^2 - rho sigma_1 sigma_2, sigma_1^2 + sigma_2^2 - 2 rho sigma_1 sigma_2) . $

#strong[第三步：代入数值计算]

代入： $ sigma_1 = 0.005 \, quad sigma_2 = 0.08 \, quad rho = - 0.3 \, $
得：
$ upright("分子") &= \( 0.08 \)^2 - \( - 0.3 \) \( 0.005 \) \( 0.08 \) \ &= 0.0064 + 0.00012 = 0.00652 \, $
$ upright("分母") &= \( 0.005 \)^2 + \( 0.08 \)^2 - 2 \( - 0.3 \) \( 0.005 \) \( 0.08 \) \ &= 0.000025 + 0.0064 + 0.00024 = 0.006665 \, $
所以： $ x^(*) = 0.00652 / 0.006665 approx 0.978 . $

#strong[第四步：解释结果]

- 最优配置约为：97.8% 投入余额宝，2.2% 投入纳斯达克指数基金；

- 纳斯达克收益高（15% vs
  1%），波动较大（8%），且与余额宝负相关程度有限（仅
  --0.3），因此*仅少量配置即可有效降低整体风险*；

- 若相关系数更负（如 $rho = - 0.6$），则最优配置中纳斯达克的比例会更高；

- 若两者正相关，则分散效果减弱，甚至应全部持有低风险资产。

#strong[启示：]

- 风险最小化 ≠ 全部投向低风险资产；

- 负相关的资产组合在一起，能起到相互"保险"的作用；

- *协方差（或相关系数）是决定分散效果的核心*，比单独看波动率更重要。

#strong[注意：]
本例仅考虑风险最小化，未考虑收益目标。若追求更高收益，需在风险与收益之间权衡。

